Thuật ngữ và lý thuyết của thống kê suy luận Thống

Thuật ngữ và lý thuyết của thống kê suy luận Thống_kê

Thống kê, ước tính và số lượng chính

Hãy xem xét một mẫu các phân phối độc lập có cùng tính chất, các biến ngẫu nhiên với một phân phối xác suất nhất định: suy luận thống kê và lý thuyết tính toán xác định một mẫu ngẫu nhiên là véc tơ ngẫu nhiên được đưa ra bởi các véc tơ theo cột của các biến phân phối độc lập có cùng tính chất.[15] Tổng thể được chọn làm mẫu được mô tả bởi một phân phối xác suất mà có thể có tham số chưa biết.

Một thống kê là một biến ngẫu nhiên, đó là một chức năng của các mẫu ngẫu nhiên, nhưng không phải là chức năng của các tham số chưa biết. Mặc dù các phân phối mẫu của xác suất thống kê có thể có tham số chưa biết.

Xem xét chức năng của các tham số chưa biết: một ước lượng là một thống kê được sử dụng để ước lượng hàm này. Ước lượng thường được sử dụng bao gồm ý nghĩa của mẫu khảo sát, không gồm mẫu phương sai và hiệp phương sai mẫu.

Biến ngẫu nhiên là một hàm của mẫu ngẫu nhiên và các tham số chưa biết, nhưng có phân phối xác suất không phụ thuộc vào các tham số chưa biết, được gọi là một đại lượng quan trọng hay biến phụ thuộc. Sử dụng biến phụ thuộc bao gồm các chỉ số z, các số liệu thống kê chi bình phương và giá trị t-value của phân phối Student.

Giữa hai ước lượng của một tham số cho trước, với ước lượng điểm trung bình bình phương được cho rằng có hiệu quả hơn. Hơn nữa một ước lượng được cho là giá trị tiệm cận nếu giá trị kỳ vọng của nó bằng với giá trị thực của tham số chưa biết được ước tính, và là giá trị tiệm cận nếu giá trị kỳ vọng của nó hội tụ ở giới hạn với giá trị thực của tham số như vậy.Các đặc tính thích hợp để ước lượng bao gồm: ước lượng UMVUE có phương sai nhỏ nhất cho tất cả các giá trị có thể có của các tham số ước lượng (đây thường là các đặc tính dễ dàng để xác minh hiệu quả) và đánh giá phù hợp cùng quy về trong xác suất để đúng với giá trị của tham số.

Điều này vẫn còn để lại những câu hỏi làm thế nào để có ước lượng trong một tình huống nhất định và thực hiện các tính toán, một phương pháp đã được đề xuất: các phương pháp trong thời điểm hiện tại, những phương pháp likelihood lớn nhất, phương pháp bình phương nhỏ nhất và phương pháp gần nhất của ước lượng phương trình.

Giả thuyết vô nghĩa và các giả thuyết thay thế

Giải thích thông tin thống kê có thể bao gồm sự phát triển của một giả thuyết trong đó giả định rằng bất cứ điều gì xảy ra được đề xuất như là một nguyên nhân không có hiệu quả trên các biến đo lường.

Minh họa tốt nhất cho một người mới làm thống kê là gặp phải tình trạng khó khăn khi thử nghiệm với những người khảo sát. Các giả thuyết không có giá trị H0, khẳng định rằng bị cáo là vô tội, trong khi các giả thuyết khác H1, khẳng định rằng bị cáo có tội. Bản cáo trạng đưa ra những nghi ngờ về việc có tội. Các giả thuyết H0 (hiện trạng) đối lập với giả thuyết H1 và được tồn tại khi H1 được hỗ trợ bằng các chứng cứ “bác bỏ những điều vô lý”. Tuy nhiên “không đạt yêu cầu để bác bỏ giả thuyết H0” trong trường hợp không bao gồm tính vô tội, nhưng chỉ đơn thuần là không đủ bằng chứng để buộc tội. Vì vậy, người được khảo sát không nhất thiết phải chấp nhận H0 nhưng không bác bỏ H0. Trong khi người ta không thể “chứng minh” một giả thuyết, người ta có thể kiểm tra xấp xỉ để đưa ra phương pháp thử nghiệm, phương pháp kiểm tra các sai số loại II.

Những gì các nhà thống kê gọi là một giả thuyết có một hoặc hai khả năng xảy ra chỉ đơn giản là một giả thuyết trái ngược với giả thuyết vô nghĩa.

Sai số

Tác động từ giả thuyết hai loại sai số cơ bản được ghi nhận:

Sai số loại I là giả thuyết rỗng bị bác bỏ là sai khi “bác bỏ phủ định”.
Sai số lại II là giả thuyết không rỗng được bác bỏ để loại bỏ và sự khác biệt trên thực tế giữa các quần thể được bỏ qua cho một “bác bỏ khẳng định”

Độ lệch chuẩn đề cập đến mức độ các quan sát cá nhân trong mẫu khác với một giá trị trung tâm, chẳng hạn như các mẫu hoặc ý nghĩa tổng thể, trong khi sai số chuẩn đề cập đến một ước tính của sự khác biệt giữa trung bình mẫu và ý nghĩa tổng thể.

Một lỗi thống kê là số lượng mà một quan sát khác với giá tị kỳ vọng của nó, giá trị thặng dư là số lượng một quan sát khác với giá trị ước lượng giả định giá trị dự kiến về một mẫu nhất định (còn gọi là dự đoán).

Sai số bình phương có nghĩa khi được sử dụng cho việc ước lượng hiệu quả thu thập dữ liệu, một lớp được sử dụng rộng rãi trong ước lượng. Sai số căn bậc hai đơn giản là căn bậc hai của sai số căn bậc hai có nghĩa.

Nhiều phương pháp thống kê nhằm giảm thiểu tổng giá trị thặng dư của bình phương, và chúng được gọi là “phương pháp bình phương nhỏ nhất” trái ngược với độ lệch chuẩn nhỏ nhất. Sau đó cung cấp cung cấp số lượng bằng với các lỗi nhỏ và lớn, trong khi trước đây chỉ ra rõ các sai số lớn hơn. Tổng giá trị thặng dư của giá trị bình phương có thể phân biệt được, nó cung cấp thuộc tính có ích để tính hàm hồi quy. Bình phương tối thiểu áp dụng hồi quy tuyến tính được gọi là bình phương nhỏ nhất thông thường và bình phương nhỏ nhất chấp nhận cho hàm hồi quy phi tuyến tính được gọi là bình phương tối thiểu phi tuyến tính. Cũng trong một mô hình hồi quy tuyến tính các phần không xác định của mô hình được gọi là sai số giới hạn, bị nhiễu hoặc có thể là dữ liệu thừa.

Tiến trình đo lường tạo ra số liệu thống kê cũng có thể có sai số. Nhiều trong số các sai số này được phân loại ngẫu nhiên (dữ liệu thừa) hoặc hệ thống (độ sai lệch), nhưng các loại sai số khác (ví dụ: sai lệch, chẳng hạn như khi một báo cáo phân tích của các đơn vị không chính xác) cũng quan trọng. Sự xuất hiện của dữ liệu bị mất và/ hoặc kiểm định, điều này có thể dẫn đến ước lượng sai lệch và từ đó đã phát triển một phương pháp cụ thể để giải quyết vấn đề này.[16]

Ước lượng theo khoảng

Khoảng tin cậy: dòng màu đỏ là giá trị thực cho giá trị trung bình trong ví dụ này, đường màu xanh là khoảng tin cậy ngẫu nhiên cho 100 giá trị.

Hầu hết các nghiên cứu chỉ ra là một phần của một mẫu tổng thể, vì vậy kết quả không hoàn toàn đại diện cho toàn bộ tổng thể. Bất kỳ ước tính thu được từ mẫu chỉ gần đúng với giá trị tổng thể. Khoảng tin cậy cho phép các nhà thống kê thể hiện chặt chẽ các mẫu dự tính phù hợp với các giá giá trị thực trong toàn bộ tổng thể. Thông thường chúng được thể hiện ở khoảng tin cậy 95%. Chính thức khoảng tin cậy 95% cho một giá ở phạm vi rộng, nếu lấy mẫu và phân tích được lặp đi lặp lại trong cùng một điều kiện (cho ra bộ dữ liệu khác nhau), khoảng cách giữa hai giá trị sẽ bao gồm giá trị thật (tổng thể) đạt 95% giá trị trong tổng số các trường hợp có thể xảy ra. Điều này không có nghĩa là xác suất mà giá trị thực trong khoảng tin cậy là 95%. Từ những quan điểm, kết luận như vậy là không có nghĩa, như là giá trị thực không phải là một biến ngẫu nhiên. Hoặc là giá trị thực hoặc trong phải trong một khoảng tin cậy. Tuy nhiên, sự thật là trước khi bất kỳ dữ liệu nào được lấy mẫu và đưa ra kế hoạch làm thế nào để tạo ra khoảng tin cậy, xác suất là 95% cho khoảng tin cậy chưa được thống kê sẽ bao gồm các giá trị đúng: tại thời điểm này, giới hạn của khoảng tin cậy là các biến ngẫu nhiên chưa được quan sát. Một phương pháp mà không mang lại một khoảng tin cậy được hiểu là một xác suất nhất định có chứa các giá trị thực sử dụng trong một khoảng tin cậy từ thống kê Bayesian: phương pháp này phụ thuộc vào cách giải thích khác nhau thế nào là “xác suất”, đó như là xác suất Bayesian.

Trong nguyên tắc chọn khoảng tin cậy có thể được đối xứng hoặc không đối xứng. Một khoảng tin cậy có thể không đối xứng vì nó hoạt động thấp hơn hoặc cao hơn các ràng buộc cho một tham số (khoảng tin cậy phía trái hoặc phải), nhưng nó cũng có thể là không đối xứng vì khoảng hai chiều được xây dựng đối xứng trong dự tính. Đôi khi các giới hạn cho một khoảng tin cậy đạt được tiệm cận và được sử dụng để ước tính giới hạn.

Mức ý nghĩa

Trong biểu đồ này dòng màu đen là phân phối xác suất cho các kiểm định thống kê, các miền quan trọng là tập hợp các giá trị bên phải của điểm dữ liệu được quan sát (giá trị quan sát của kiểm định thống kê) và giá trị p-value được đại diện bởi các khu vực màu xanh lá cây.

Thống kê hiếm khi chỉ trả lời các câu hỏi dưới dạng có/không dưới các phân tích. Sự giải thích thường đi xuống đến mức ý nghĩa thống kê áp dụng với số lượng và thường đề cập đến xác suất của một giá trị chính xác từ chối giả thuyết rỗng (có thể xem như là giá trị p-value).

Phân phối chuẩn[15] là để thử nghiệm một giả thuyết đối với một giả thuyết khác. Một miền quan trọng là để tập hợp các giá trị của các ước lượng dẫn đến bác bỏ giả thuyết rỗng. Do đó xác suất của sai số loại I là xác suất mà các ước lượng thuộc các khu vực quan trọng cho rằng giải thuyết đúng (có ý nghĩa thống kê) và xác suất sai số loại II là xác suất mà các ước lượng không thuộc miền quan trọng được đưa ra bằng giả thuyết thay thế là đúng. Các số lượng thống kê của một thử nghiệm là xác suất mà nó đúng bác bỏ giả thuyết rỗng khi giả thuyết là sai.

Đề cập đến mức ý nghĩa thống kê không nhất thiết là kết quả của tổng thể so với số hạng thực. Ví dụ, trong một nghiên cứu lớn về một loại thuốc có thể chỉ ra rằng thuốc có tác dụng mang lại lợi ích đáng kể về mặt thống kê nhưng rất nhỏ, như vậy loại thuốc này dường như không có khả năng tác dụng nhiều cho bệnh nhân.

Trong khi về nguyên tắc mức chấp nhận ý nghĩa được thống kê có phải xem xét vấn đề, các giá trị p-value là mức ý nghĩa nhỏ nhất cho phép thử nghiệm để bác bỏ giả thuyết. Kết quả tương đương nói rằng các giá trị p-value là xác suất, giả định giả thuyết là đúng, kết quả quan sát là cực kỳ thấp như kiểm định thống kê. Do đó giá trị p-value càng nhỏ, xác suất sai số loại I càng thấp.

Một vấn đề thường xảy ra với loại này:

Một sự khác biệt đó là có ý nghĩa thống kê cao vẫn có thể không có ý nghĩa, nhưng nó có thể phát biểu đúng các kiểm định trong thống kê. Một câu trả lời trở thành giả thuyết chỉ có mức ý nghĩa bao gồm các giá trị p-value, tuy nhiên không biết được kích thước hay tầm quan trọng của kiểm định quan sát được và cũng có thể kết luận được tầm quan trọng của các khác biệt nhỏ trong các nghiên cứu lớn. Một cách tiếp cận tốt hơn và ngày càng phổ biến là để báo cáo khoảng tin cậy. Mặc dù chúng được đưa ra từ việc tính toán tương tự như những kiểm định giả thuyết hoặc giá trị p-value, mô tả kích thước của ảnh hưởng và những điều không chắc chắn.
Độ sai lệch của thay đổi điều kiện, những ý kiến sai lầm của Aka: những lời phê bình chỉ ra các giá trị để kiểm định giả thuyết (giả thuyết vô nghĩa) được ưa chuộng, vì xác suất của kết quả của giả thuyết vô nghĩa đưa ra kết quả quan sát được. Một thay thế cho phương pháp này được đưa ra bởi suy luận Bayesian, mặc dù nó đòi hỏi việc một xác suất cho trước.[17]
Bác bỏ giả thuyết không tự động chứng minh được giả thuyết thay thế.
Như tất cả mọi thứ trong thống kê suy luận nó dựa vào kích thước mẫu, và do đó dưới miền giá trị p-value giá trị có thể không được tính.

Các ví dụ

Một số thử nghiệm và thống kê nổi tiếng là:

Phân tích phương sai (ANOVA)
Kiểm định chi bình phương
Sự tương quan
Phân tích nhân tố
Mann-Whiteney
Độ lệch chuẩn ý nghĩa bình phương
Hệ số tương quan Pearson
Phân tích hồi quy
Thứ bậc hệ số tương quan của Spearman
Kiểm định t-test
Chuỗi thời gian